ابداع سیستمی برای کاهش خطا های هوش مصنوعی
به گزارش گوپا، دانشمندان روسی سیستمی را برای کاهش خطا های هوش مصنوعی با تأیید اطلاعات در زمان حقیقی توسعه دادند.
به گزارش گوپا به نقل از خبرنگاران جوان، توسعه سریع هوش مصنوعی (AI) بعد از گزارش هایی بر اساس این که تعدادی از شبکه های عصبی امکان دارد در زمینه های خاص اطلاعات ناصحیح یا گمراه کننده تولید کنند، جنجال جدیدی را برانگیخته و پرسشهایی را در مورد قابلیت اطمینان آنها مطرح کرده است.
در جواب درخواست ها برای گزارش در مورد پدیده های مورد علاقه کاربران، هوش مصنوعی در تعدادی موارد آغاز به ارایه اطلاعات ناصحیح یا غیرقابل اعتماد درحال افزایشی کرده است.
این امر به این واقعیت نسبت داده می شود که شبکه های عصبی منابع اطلاعاتی موجود در اینترنت را بطور انتقادی تأیید نمی کنند، بلکه به داده های انتشار یافته خود متکی هستند که امکان دارد حاوی محتوای ناصحیح یا گمراه کننده باشند.
درنتیجه، چندین مورد بحث برانگیز، خصوصاً در روزنامه نگاری، ثبت شده است که در آن تعدادی از روزنامه نگاران بدون تأیید کافی به گزارش های ساخته شده توسط هوش مصنوعی تکیه کرده اند. مشکلات مشابهی نیز در زمینه های دیگر، همچون تحقیقات علمی، پدیدار شده است.
در کوشش برای رسیدگی به این موضوع، دانشمندان دانشگاه رشتنف در کراسنویارسک، سیبری شرقی، روشی را با هدف کاهش اطلاعات غیرقابل اعتماد یا ساختگی در پاسخ های مدلهای هوشمند توسعه داده اند.
این تکنیک شناسی به سیستم هایی معروف به RAG (تولید بهبودیافته بازیابی) متکی است، که در آن یک پایگاه دانش از منابع باکیفیت بالا و قابل اعتماد ایجاد می شود که هوش مصنوعی سپس از آن برای تولید پاسخ ها استفاده می نماید.
پژوهشگران توضیح دادند که این رویکرد احتمال تولید اطلاعات ناصحیح را به میزان قابل توجهی کم می کند. در عین حال، بازهم امکان دارد به علت اشتباهات ورود داده ها، ناسازگاری های پرس وجو یا یک پایگاه دانش ناقص، خطا رخ دهد.
یک تیم تحقیقاتی به رهبری دانشیار آناستازیا پلیاکووا از گروه سیستم های هوشمند و اتوماسیون، مواردی را که پاسخ های هوش مصنوعی نادرستی نشان می دهند، تحلیل و بررسی کرده و یک طبقه بندی کننده برای شناسایی آنها ایجاد کردند.
آنها همین طور دستورالعمل های آزمایش خودکاری ایجاد کردند که پرس وجو های آزمایشی ایجاد می کنند و پاسخ ها را با معیار های مرجع مقایسه می کنند و دقت را برمبنای معیار های شباهت معنایی ارزیابی می کنند.
برمبنای نتایج مراحل اولیه، پژوهشگران یک واحد نظارت بر زمان واقعی نمونه اولیه ایجاد کردند که پرس وجو ها و زمینه مکالمه را ثبت می کند، قابلیت اطمینان پاسخ ها را ارزیابی می نماید و به هر مدل یک امتیاز اطمینان اختصاص می دهد. اگر سطح اطمینان کاهش پیدا کند یا خطای احتمالی تشخیص داده شود، این واحد هشداری را به سرپرست ارسال می کند.
پژوهشگران خاطرنشان می کنند که این تکنیک خیلی منعطف است، برای اینکه می تواند در چت بات ها و سیستم های دولتی مبتنی بر هوش مصنوعی در زمینه های مختلف، از پزشکی گرفته تا حقوق و مذهب، اعمال شود.
به گزارش گوپا به نقل از خبرنگاران جوان، توسعه سریع هوش مصنوعی (AI) پس از گزارش هایی بر طبق این که بعضی از شبکه های عصبی امکان دارد در حوزه های خاص اطلاعات ناصحیح یا گمراه کننده تولید کنند، جنجال جدیدی را برانگیخته و پرسشهایی را در مورد قابلیت اطمینان آنها مطرح کرده است.
در جواب درخواست ها برای گزارش در مورد پدیده های مورد علاقه کاربران، هوش مصنوعی در تعدادی موارد شروع به ارائه اطلاعات ناصحیح یا غیرقابل اعتماد در حال افزایشی کرده است.
این امر به این حقیقت نسبت داده می شود که شبکه های عصبی منابع اطلاعاتی موجود در اینترنت را به طور انتقادی تأیید نمی کنند، بلکه به داده های منتشر شده خود متکی هستند که امکان دارد حاوی محتوای ناصحیح یا گمراه کننده باشند.
درنتیجه، چندین مورد بحث برانگیز، به ویژه در روزنامه نگاری، ثبت شده است که در آن بعضی از روزنامه نگاران بدون تأیید کافی به گزارش های ساخته شده توسط هوش مصنوعی تکیه کرده اند. با این وجود، بازهم امکان دارد به دلیل اشتباهات ورود داده ها، ناسازگاری های پرس وجو یا یک پایگاه دانش ناقص، خطا رخ دهد.
یک تیم تحقیقاتی به رهبری دانشیار آناستازیا پلیاکووا از گروه سیستم های هوشمند و اتوماسیون، مواردی را که پاسخ های هوش مصنوعی نادرستی نشان می دهند، تجزیه وتحلیل کرده و یک طبقه بندی کننده برای شناسایی آنها ایجاد کردند.
آنها همچنین دستورالعمل های آزمایش خودکاری ایجاد کردند که پرس وجو های آزمایشی ایجاد می کنند و پاسخ ها را با معیار های مرجع مقایسه می کنند و دقت را برمبنای معیار های شباهت معنایی ارزیابی می کنند.
برمبنای نتایج مراحل اولیه، محققان یک واحد نظارت بر زمان حقیقی نمونه اولیه ایجاد کردند که پرس وجو ها و زمینه مکالمه را ثبت می کند، قابلیت اطمینان پاسخ ها را ارزیابی می نماید و به هر مدل یک امتیاز اطمینان اختصاص می دهد.
منبع: گوپا
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب